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Аналіз роботи систем розпізнавання жестів 


У наведеній статті розглядається один з перспективних напрямків розвитку інформаційних технологій в 
області інтерфейсу людина-машина на основі використання природного для людини способу спілкування з 
комп'ютерами. Надано огляд основних етапів, процедур та технологій збору даних, що застосовуються у 
роботі системи розпізнавання жестів. Проводиться поетапний аналіз роботи систем розпізнавання жестів, 
визначені основні проблеми їх побудови та пропонуються оптимальні шляхи їх подальшого вирішення. 


Вступ 


Перспективним напрямком розвитку інформаційних технологій є розробка нових 
способів забезпечення інтерфейсу людина-машина. Перед розробниками подібних інтер- 
фейсів ставиться задача використання природних для людини способів спілкування з 
комп'ютерами. Враховуючи усі можливі перешкоди та наявність шумів в оточуючому 
середовищі, перевага надається системам на основі комп'ютерного зору. Особливо пер- 
спективними для побудови інтерфейсів управління програмним та апаратним забезпечен- 
ням комп'ютерів є жести | 1-3|. Перевага такого інтерфейсу полягає у тому, що жести 
дозволяють розширити можливості інтерфейсу для людей з вадами слуху і мови, та 
забезпечити дистанційне управління різними побутовими пристроями, хоча при їх ство- 
ренні існує ряд не повністю вирішених задач, які розглядаються у статті. 

Розглянемо роботу систем управління жестами, які можуть бути вбудовані у муль- 
тимедійні пристрої 1 заміняти собою пульт дистанційного керування. 

Робота системи складається з основних етапів: 

1) отримання зображення, збір даних - об'єкт (рука) фіксується за допомогою 
камер, які підключені до ПК; 

2) локалізація руки на зображенні, виділення пальців руки - на отриманому 
зображенні знаходиться ділянка руки; 

3) розпізнавання жестів - виділення характерних ознак (контур руки, колір шкіри); 

4) класифікація жестів та присвоєння розпізнаному жесту певної команди. 

Метою даної статті є аналіз роботи систем розпізнавання жестів, які розгля- 
даються як системи машинного зору для виявлення та позиціонування жестів людини. 


Огляд основних етапів та процедур 
в системі розпізнавання жестів 


Першим етапом будь-якої системи розпізнавання є збір даних (як дані може вико- 
ристовуватись інформація про колір). 

Інформація, отримана за допомогою зображення, обробляється для виділення об- 
ласті руки від фону. Цей етап називається локалізацією руки на зображенні. 
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Після збору даних стає можливим використання первинної інформації про руку 
для фільтрації даних та видалення шумів на зображенні, які можуть виникнути, напри- 
клад, через перепади освітлення, а також видалення артефактів (наявність на руці каб- 
лучок). Дана процедура є надзвичайно важливою, так як набором жестів, які необхідно 
розпізнати, визначається кількість та розмір отриманих даних 1 для реалізації якісного 
розпізнавання необхідною умовою є точність (достовірність) цих даних. 

На етапі розпізнавання рухів рук здійснюють виділення ознак. Вибір ознаки є важ- 
ливою частиною процесу розпізнавання, тому що рухи рук відрізняються розмаїтістю 
форм, рухів і текстур. Для розпізнавання статичного положення руки застосовують 
геометричні ознаки, такі як кінчики пальців, напрямок пальців. Але такі ознаки не 
завжди доступні 1 не завжди надійні через самозатінення та умови освітлення. В даній 
статті як ознаки використовуються властивості контуру, які описують жести. 

Наступним етапом буде визначення конкретних жестів на основі аналізу відфіль- 
трованих даних, які несуть інформацію про рух руки. З цією метою проводиться про- 
цедура класифікації. Але перед цим систему необхідно «навчити» реагувати на жести, 
та адаптувати їх щодо конкретних рухів рук користувача. В результаті навчання система 
поступово здобуває здатність відповідати потрібними реакціями на певні сукупності 
зовнішніх впливів, а в результаті адаптації відбувається підстроювання параметрів 1 
структури системи з метою досягнення необхідної якості керування в умовах безпе- 
рервних змін зовнішніх умов. 

Як об'єкти навчання можуть виступати візуальні зображення рук. 

Пропонується використовувати набір жестів з алфавіту глухонімих, що розширить 
можливості інтерфейсу для людей з дефектами слуху. 


Технології збору даних 


Для збору інформації в основному застосовуються наступні технології: 

1. Контактні. Використовується інформаційна рукавичка (ака бЇоме - пристрій 
введення даних у системі віртуальної реальності, що фіксує рухи руки користувача 
та передає їх до комп'ютера) для захоплення рухів руки. На основі даних, отриманих 
за допомогою цих пристроїв програмними засобами, формується модель руки. 

2. Безконтактні (оптичні методи) - методи комп'ютерного зору. Переваги 
контактних технологій полягають у високій завадостійкості та можливості здійсню- 
вати процеси в режимі реального часу. До недоліків можна віднести необхідність 
одягання рукавички, що накладає певні обмеження на користувача. Саме тому перевага 
була надана безконтактним технологіям, які є більш практичними та ефективнішими, 
і звільняють рух рук користувача від обмежень. 

Для того щоб розпізнати жести руки, необхідно зібрати інформацію про руку за 
допомогою однієї або декількох камер. Відповідно цього існують різні системи, які 
можна класифікувати наступним чином: 

Стереографічна система надає детальну попіксельну інформацію для будь- 
якої точки в полі зору камер і, таким чином, забезпечує великий об'єм інформації про 
руку. За допомогою такої системи можна легко відокремити пальці руки на фоні шкіри, 
оскільки вони знаходяться ближче до камери. Проте для обчислення 3 І) даних знадо- 
биться багато операційного часу, що виключає використання алгоритмів у режимі реаль- 
ного часу. 

Багатокамерна 2 Ї система спостереження буде видавати меншу кількість 
інформації у порівнянні зі стереографічною, але й потребуватиме менше часу на оброб- 
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ку (за умови, що кількість камер невелика). За допомогою цієї системи два або й більше 
2. зображень руки, які отримали з різних камер, можна об'єднати для розпізнавання 
жестів. Достатня кількість камер забезпечить повний об'єм інформації для визначення 
будь-якого жесту. 

Однокамерна система буде забезпечувати значно меншу кількість інформації 
про руку. Деякі особливості, наприклад, палець на фоні шкіри буде дуже важко визна- 
чити, оскільки буде відсутня інформація про його товщину. В основному точно може 
бути визначена тільки інформація про контур. Дані про контур будуть відносно позбав- 
лені від шумів (за умови, що рука успішно відділяється від фону) та на їх обчислення 
знадобиться невелика кількість часу. 

Можливо визначити велику кількість жестів, використовуючи тільки інформацію 
про контур, окрім цього однокамерна система вносить менше завад, дешевша та має 
найкращу швидкодію. Хоча система отримує найменше інформації у порівнянні Із 
попередніми системами, цей недолік повністю перекривається перевагами, які були 
вказані вище. Тому було вирішено використовувати саме однокамерну систему для 
збору даних. 

Дані на виході вибраної однокамерної системи представляють 2 0 масив ВСВ- 
пікселів, отриманих в різні проміжки часу. Для того щоб визначити інформацію про 
контур, необхідно відділити пікселі шкіри від пікселів фону на зображенні. Щоб вико- 
ристовувати інші ознаки для забезпечення додаткової інформації про руку, їх також 
потрібно відокремити від фону (та пікселів шкіри). Для реалізації цього важливо пра- 
вильно підібрати обладнання та забезпечити певні умови. 

Задача виділення пікселів шкіри буде набагато простішою за умов правильного 
освітлення. Якщо освітлення в полі зору камери постійне, то ефект самозатінення можна 
звести до мінімуму. Для забезпечення достатньої кількості світла для ПЗЗ камери 
яскравість теж має бути наперед задана. 

Однак, оскільки система розпізнавання жестів розробляється для звичайного спо- 
живача, то вимоги до використання спеціального освітлення будуть накладати певні 
незручності. Отже, надалі будемо вважати, що інформація про руку визначається за 
умов освітлення стандартної кімнати, хоча це обмежить використання системи за умов 
іншого навколишнього середовища. 


Локалізація області руки 
Вибір колірного простору 


Колірний простір являє собою модель подання кольору, засновану на використанні 
колірних координат. Колірний простір будується таким чином, щоб будь-який колір 
був представлений точкою, яка має певні координати, причому так, щоб одному набору 
координат відповідав один колір. 

Розрізняють КСВ та Н5Ї, колірні моделі. 

Результати детектування за допомогою Н5І моделі показали, що тон є ненадій- 
ним параметром для визначення ділянок шкіри на зображенні, оскільки значення 
тону шкіри та тону фону частково співпадають. Насиченість дає ненабагато кращі ре- 
зультати, а найбільш оптимальним параметром виявилась яскравість. В даному випадку 
найкращі результати визначення ділянок шкіри на зображенні дає поєднання значень 
насиченості та яскравості. 

Як показали результати, у випадку використання КСВ-моделі, області для кожної 
колірної компоненти легко відокремити. Враховуючи це і той факт, що обчислення 
ЕКСВ-простору не вимагає додаткового часу на перетворення КСВ в Н5Ї,, превага була 
надана саме КОВ колірному простору. 
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Згідно з аналізом результатів тестування за різних умов освітлення, яке викону- 
валось над послідовністю зображень з камери, було визначено, що сегментація, яка 
проводиться в В (г канал у нормалізованому КСВ просторі) 1 5 (5 канал НЗМ колір- 
ного простору) каналах, є найбільш стійкою до змін освітлення, а також має найменший 
відсоток помилок 2-го роду. Це свідчить про доцільність застосування саме цього методу 
сегментації в В 15 каналах різних колірних просторів (41. 


Обробка зображень. Відокремлення області зап'ястя 
та передпліччя 


На етапі обробки зображення для подальшого коректного розпізнавання жесту 
необхідно відокремити пікселі шкіри, які описують кисть та будуть у подальшому ви- 
користовуватись для визначення жесту, від пікселів шкіри, які відносяться до області 
зап'ястя та області передпліччя. Оскільки для всіх них значення кольору майже одна- 
кові, то для визначення та видалення небажаних пікселів буде використовуватись інфор- 
мація про розташування пікселів руки та зап'ястя. 

За допомогою усереднення значень детектованих пікселів можливо обчислити 
центроїд (центр ваги) руки та зап'ястя. 

Набір положень всіх пікселів шкіри обчислюється за формулою: 


се |хі8(г(х),е(х),ь(х))- 0. 


Дентроїд руки: 


Дентроїд зап'ястя: 


де 1Й -- кількість елементів І.. 


Краї зап'ястя можна знайти шляхом сканування ліній паралельно лінії, яка 
з'єднує два центроїда. Вектор, з'єднуючий два центроїда, можна визначити як: 


са (ХакУча) ем 
Кут повороту руки: 
9 атап "| Уа 
з х 
чі 
Тоді краї зап'ястя обчислюються наступним чином для кожної точки р, (з, ) 


вздовж лінії: 


де (-50 « 8; « 50) 
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Для кожної функції 5; обчислюється кількість пікселів зап'ястя п(51) вздовж лінії 
Со5б (9, ) 


8іп(8,) 


р. (8»8») зр, 55, 


де (-50 4 8» 2 50) 
2 - - г 7 бек 
Дві точки, які визначають краї зап'ястя Б, , або кобсуба) та Бішж або 


Уві дорівнюють р. (зі)» коли значення п(5;) нижче певного порогу. За 


допомогою порогу можливо виділити значення пікселів, які знаходяться в області 
зап'ястя. 
Радіус області зап'ястя визначається як: 


ь С 


пів Уз 


їі тзах (бу -б, 


2 


Виділення пальців руки 


Виявлення та локалізація мінімумів, максимумів руки (екстремумів), тобто кін- 
чиків пальців 1 проміжків між пальцями, надасть додаткову інформацію при виконанні 
процедури розпізнавання жестів. Оскільки і мінімуми, і максимуми характеризуються 
великою кривизною, проводяться експерименти з гістограмою кривизни контуру, тобто 
розглядається ділянка кривизни контуру в різних масштабах уздовж всієї довжини 
шляху. 9 послідовних максимумів гістограми кривизни беруться як шукані значення 
кінчиків пальців. Слід зазначити, що цей метод досить чутливий до розривів контуру 
і виникають проблеми при визначенні порожнин 1 зламів в області зап'ястя. Тому 
було зосереджено увагу на більш надійному альтернативному методові, який полягає 
у побудові графіка залежності відстані за радіусом від опорної точки (точки відліку) 
в області зап'ястя. Як опорна точка береться перша точка перетинання головної осі з 
лінією зап'ястя. В результаті одержуємо послідовність відстаней за радіусом, які пред- 
ставляють мінімуми та максимуми, тобто шукані екстремуми. Значення екстремумів 
є дуже надійними, оскільки на визначення 5 максимумів (пальців) 1 4 мінімумів не 
впливають шуми на контурі. 

Для всіх наступних етапів обробки рук використовується інформація, отримана 
з набору базисних осей чотирьох пальців (вказівний, середній, безіменний, мізинець). 
Встановлено, що базисна лінія - це лінія, що проводиться через чотири точки відпо- 
відно до методу найменших квадратів або просто з'єднує базисні точки вказівного 
пальця і мізинця. Ця лінія називається основною лінією руки (ріуої Ппе). Основна 
лінія руки використовується для: по-перше, реєстрації всіх зображень руки відповідно 
до обраного кута повороту лінії. По-друге, кути повороту пальців обчислюються сто- 
совно основної лінії. Нарешті, орієнтація та розмір основної лінії допомагає визначити 
великий палець 1 область зап'ястя. 

Після того як визначені екстремуми, за допомогою зазначеного вище методу 
проводяться відрізки уздовж бічної сторони пальця, починаючи від кінчика до двох 
сусідніх точок проміжку між пальцями. Вибирається найкоротший відрізок і потім 
від однієї точки до іншої проводиться крива. Отримана крива у формі серпа чітко роз- 
межовує палець, таким чином можна обчислити його довжину. Однак, для великого 
пальця операції локалізації трохи відрізняються. 

Рух великого пальця ускладнюється тим, що він включає обертання відносно 
двох різних суглобів (п'ясної фаланги та кістки-трапеції). Складність полягає у тому, 
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що натягнута шкіра між великим і вказівним пальцем вносить погрішності при визна- 
ченні западини між пальцями та при визначенні великого пальця. Відповідно до ана- 
томії вважається, що великий палець такої ж довжини, як і мізинець. Проводиться 
лінія уздовж головних осей пальця і точка на цій лінії, що перебуває на відстані 
12096 від розміру мізинця, формує базисну лінію великого пальця. Палець перемі- 
шується таким чином, що його базисна лінія збігається з вершиною лінії руки, коли 
остання відхиляється на 90 градусів за годинниковою стрілкою. Великий палець обер- 
тається за остаточним напрямком 1 повертається на місце. 

При виявленні та локалізації пальців руки необхідно враховувати такий момент, 
як обертання пальців. Пальці обертаються навколо точки між основною фалангою та 
п'ястковою кісткою (мед.). П'ясткова кістка - це кістяк руки між зап'ястям і п'ятьма 
пальцями. Цей кістяк складається з 5 довгих трубчастих кісток, які перебувають між 
кістками зап'ястя та пальців (фаланг). Ці з'єднання трохи нижче лінії, що з'єднує 
проміжки між пальцями. Тому головна вісь кожного пальця збільшується в довжину на 
2090 і перевищує відповідну довжину пальців. Сукупність кінцевих точок осей чотирьох 
пальців (вказівний, середній, безіменний, мізинець) визначає лінію, що залежить від 
розміру та орієнтації руки. 

Головні осі кожного пальця обчислюються за допомогою власної матриці 
інерційних характеристик. Поточний кут напрямку пальця визначається як 


9 - ака у, / й), де (й у) - основний власний вектор. Кожен палець і 
повертається на кут 40 - 0 -.» при і - вказівний палець, середній, безіменний, 
мізинець, а у - напрямок пальця. Обертання пальця здійснюється шляхом мно- 
ження вектора положення пікселів пальця на матрицю обертання навколо базисної 
лінії (рімог): 
со5(Л0) -зіп( 40) 
зіп(Л0)  со5(Д0) 
Стандартні кути пальців для середньої руки наведені в табл. 1. Будь-який інший 


набір кутів буде однаково добре працювати в даному алгоритмі за умови, що при цьому 
наборі кутів пальці будуть відокремлені один від одного. 


Таблиця І - Кути обертання пальців 


Великий палець Вказівний Середній Безіменний Мізинець 
150 120 100 80 60 


Розпізнавання жестів 


Аналіз існуючих методів 


Методи розпізнавання в системах комп'ютерного зору можна розділити на два 
види - методи на основі створення тривимірної моделі руки й методи на основі 
виділення ознак (51. 

Методи на основі створення тривимірної моделі руки базуються на побудові 
кінематичної моделі, яка враховує всі можливі ступені свободи |6). Для цього потрібно 
оцінити жести руки за допомогою порівняння положення руки на вхідному зобра- 
женні та двовимірної проекції моделі жесту з бази даних. Такі методи потенційно 
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дозволяють розпізнавати значну кількість жестів. Однак, з метою його реалізації потрібне 
створення великої бази даних зображень для порівняння з побудованою моделлю та 
подолання складностей при виділенні ознак з урахуванням анатомічних особливостей. 

Методи на основі виділення ознак засновані на врахуванні особливостей зобра- 
жень, які використовуються для визначення положення руки. Одним з підходів є зна- 
ходження ділянок шкіри на зображенні з використанням колірних ознак. 

Методи на основі виділення ознак застосовуються за умови, якщо можливо іден- 
тифікувати характерні точки або області на об'єктах, а сам об'єкт може бути представ- 
лений як сукупність цих областей. У цьому випадку замість моделювання об'єкта 
в цілому, моделюється деяка множина характерних областей. Перевага цього підходу 
полягає в тому, що він стійкий до деформацій та інших змін вхідних даних. При 
визначенні достатньої кількості характерних точок, об'єкт надійно ідентифікується. 
Для завдань визначення та розпізнавання жестів у реальному часі дані методи є пер- 
спективними, тому було вирішено застосовувати саме їх. 


Вибір методу розпізнавання 


На етапі розпізнавання рухів рук здійснюють виділення ознак. Вибір ознаки є важ- 
ливою частиною процесу розпізнавання, тому що рухи рук відрізняються різноманіт- 
ністю форм, рухів і текстур. Для розпізнавання статичного положення руки застосовують 
геометричні ознаки, такі як кінчики пальців, напрямок пальців. Але такі ознаки не завжди 
доступні 1 не завжди надійні через самозатінення та умови освітлення. В даній роботі 
як характерна ознака використовуються властивості контуру. 

Для отримання характерних ознак, а саме інформації про контур, застосовується 
аналіз незалежних компонент. 


Аналіз незалежних компонент 


Аналіз незалежних компонент (АНК) використовується для вибору статистично 
незалежних змінних з їх сукупності |7|. Він успішно застосовується в різних додатках 
для пошуку схованих коефіцієнтів серед даних для аналізу або ж для їхнього розкла- 
дання на вихідні сигнали; для реального зображення АНК також служить корисним 
інструментом для отримання характерних ознак та завдань ідентифікації людини. 

Як вхідні дані використовуються 1-0) бінарні сигнали джерела, які несуть інфор- 
мацію про контур руки на зображенні. 

АНК припускає, що кожний зі спостережуваних сигналів іх (К), К - 1,..., К) 
являє собою суміш із набору М-невідомих сигналів незалежних джерел 5; в невідомій 
матриці змішування А. х; та 5; формують рядки в матрицях Х та 5, розмірністю МхК, 
відповідно: Х - А5. 

Вектори даних для АНК - це пікселі руки на зображенні. К - розмірності цих 
векторів (наприклад, К - 40000, якщо є зображення руки розміром 200х200). Ціль 
АНК - знайти таке лінійне перетворення УУ/ для вхідних даних, яке мінімізує статис- 
тичну залежність між вихідними компонентами у;, за допомогою яких оцінюються 
передбачувані незалежні джерела 5;: 


фаУЇУзИХ. 
Для того щоб знайти У/-перетворення, яке називають матрицею розкладання, 
застосовується швидкий алгоритм АНК: він максимізує статистичну незалежність між 


За допомогою АНК можна одержати незалежні базисні зображення або ж незалежні 
коефіцієнти змішування. 
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У першому випадку вважається, що М - це дані про руку, що являють собою ліній- 
ну суміш невідомого набору М-статистично незалежних джерел сигналів, які несуть ін- 
формацію про руку («Бапа 50йгсе5»). 

Для одержання векторів даних застосовується растрове сканування нормованого 
зображення рук. Для зображень розміром 200х200, матриця даних Х буде М х 40000 
мірною, отже, га - 40000. Ця матриця розкладається на М незалежних компонентів 
джерела 8, які формують ряди вихідної матриці 5 ЗХ. Кожен рядок матриці 
змішування А (МхМ) буде містити вагові коефіцієнти, характерні для даної руки. Ці 
коефіцієнти показують відносний внесок джерела сигналів, які несуть інформацію 
про руку, у синтез даного зображення руки. Із цього випливає, що тестове зображення 
руки х; 1-го рядка матриці А буде являти собою М-мірний вектор ознак. 

На етапі розпізнавання, вважаючи, що тестовий набір наслідує ту саму модель 
синтезу з тими ж незалежними компонентами, нормований тестовий набір зображень 
руки (1х40000) проектується на набір визначених базисних функцій, а результуючий 
вектор коефіцієнтів проекції обчислюється за формулою: 


д РАННЮ 
Ме т т 
дея Хан (55 ) - 

Нарешті, окрема ознака, що тестується, розпізнається як характерна для руки 
людини |З, коли значення дз Перебуває найближче всього до значення вектора о03- 


наки ах», а відстань вимірюється за допомогою 1. метрики: 


М 


їж з агро тіпа У; 


(і) уч 


а..-а 


і,) 1е51,) 


У другому випадку вважаються незалежними коефіцієнти накладення, а не базисні 
зображення. Такий підхід передбачає, що кожен К-піксель зображення руки одержують із 
незалежних сумішей випадкових величин, тобто джерел сигналів, які несуть інформацію 
про піксель («ріхе! зоигсе5»). Виходячи із цього, виконується транспонування матриці 
даних: Х/. Однак величезна розмірність піксельних векторів (як правило, К»? М) вимагає 
виконання процедури аналізу головних компонентів (АГК) перед реалізацією АНК. 

1 Х" 


Власні вектори коваріаційної матриці М , розмірністю КхК, де кожен 
ряд матриці Р центрований, можна обчислити за допомогою власних векторів 
матриці Х Х! набагато меншої розмірності МхМ. 

Нехай (Ур-зук) - власні вектори М-ряду із власними значеннями (4, 2 2,2.) 
матриці Х Х/, розмірності МхМ, Тоді відповідно до теореми розкладання за 
сингулярними числами матриці (зіпеціаг уаїше десогаровійоп, 5УЮД), ортонормовані 


власні вектори Гу но Ми матриці С, що відповідають М х« М найбільшим 
І 

власним значенням |Л,,Л...., А, |, визначаються як 7 ву хг ТеР2ІМ. 
У 


Після проектування вхідного вектора х на власні у, ми одержимо |-е ознаку 


1 
у Хх'" з В х", де В являє собою оператор проектування. 


У; х і 

Кількість даних зображення руки зменшується після проекції на невелику 
кількість М-головних компонентів, і таким чином формується квадратна матриця 
даних ВХ! . Потім ВХ! розкладається на джерело та коефіцієнти перемішування 
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залежно від моделі, стовпці оціненої матриці змішування А (МхМ) представляють 
собою базисні функції (зображення руки). І навпаки, коефіцієнти оціненої матриці 
джерела сигналів є статистично незалежними. 


На етапі розпізнавання тестовий набір зображень рук зменшує свою розмірність за 
Т 
1е51 


допомогою Кх,, і множиться на матрицю розкладання М/ ейА. Результуючий 
вектор коефіцієнтів тестового набору зображень рук Хі: (К.Х1), визначається за форму- 


лою р, 2 И/ Вх,,,» 1 потім порівнюється із заданими векторами ознак на етапі навчання. 


Нарешті, зображення руки, що тестується, розпізнається як характерне для руки лю- 
дини і за допомогою найближчого вектора ознаки р, , де відстань визначається коси- 


нусом кута між ними: 


ї заго тах с . П емо. 
Ці Рі Римі 


Після розпізнавання жестів відбувається процедура класифікації та присвоєння 
команди. Види команд визначаються специфікою застосування розробленої системи 
розпізнавання. Наведені системи управління можуть бути інтегровані в побутові, 
медичні та охоронні пристрої. 


Висновки 


Досліджено роботу систем управління жестами як перспективного інтерфейсу 
людина-машина, що містить наступні етапи: 1) захоплення зображення; 2) локалізація 
руки; 3) розпізнавання жестів; 4) формування команд. Такі системи дозволяють реа- 
лізувати дистанційне управління автоматизованими пристроями не тільки звичайними 
користувачами, а й людьми з вадами слуху і мови. 

Обраний для локалізації руки на зображенні метод сегментації за кольором за- 
безпечує достатню швидкодію для того, щоб його програмна реалізація могла працювати 
в реальному часі. 
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Е.Ю. Ломакина 

Анализ работьт систем распознавания жестов 

В приведенной статье рассматриваєтся одно из перспективньїх направлений развития информационньтх 
технологий в области интерфейса человек-машина на основе использования естественного для человека 
способа общения с компьютерами. Предоставлен обзор основньхх зтапов, процедур и технологий сбора 
данньх, которье применяются в работе системьт распознавания жестов. Проводится позтапньшй анализ 
работь систем распознавания жестов, определень основньже проблемьт их построения и предлагаются 
оптимальньюе пути их дальнейшего решения. 


Е.У. Готакіпа 

Апаїузіє ої Себіиге Кесоєпійоп З5у5гет Орегабіоп 

Тріз агіїсіє дезсгібеє опе ої Бе гло5і регвресіїує дїгесіїоп5 ої іпіогпайоп іесбпоїогу деусіортепі їог 
ритап-птасріпе ішіегіасе Базед оп ритап пакига! плеап5 ої іпіегасіїоп Бебмееп Бритап апа соприег. А 
геміему об ай плаїп 5іаєє8, ргоседиге5 апа Чака сарішге іесрппоїорбіе5 місії аге ц5ед дигіпе орегайоп ої 
дезіиге гесобпійоп 15 герге5епіей. ТВе 4еїаї! апаЇузіяє ої безгиге гесорпійоп 5у5їет орегайоп 15 ргоуїдеа. 
АЇ таїп ргобіетаз ої сезїите гесорпійоп 5у5іет деуеЇортепі апа їпеїг оріта! 5о0Їийопя аге дейпеа. 


Стаття надійшла до редакції 06.06.2011. 
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